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Beschreibung 

Controlling- und Marketingverf ahren fur die Nutzung des In- 
ternet/Intranet 

5 

Der Anmeldungsgegenstand betrifft ein Verfahren zur Erfassung 
des Nutzungsverhaltens eines Teilnehmers im Internet/Intranet 
umfassend die Merkmale des Anspruchs 1. 

10 Nicht vertragsgemafie Nutzung des Internetzugangs (z.B, von 
Privatpersonen bei flat rate Tarifen eines Internet Service 
^1^^^ Provider oder von Angestellten einer Firrcia) kann eine Grofien- 
^^^V ordnung erreichen, die die Geschaf tsbasis eines Internet Ser- 
vice Provider oder einer Firma gefahrdet. Derzeit ist es 
15 technisch sehr schwierig, solche Nut zungsf alle so fruhzeitig 
zu erkennen, dal3 rechtzeitig reagiert werden kann. 

Privat- und Geschaf tskunden oder auch Angestellte einer Firma 
nutzen das Internet/ Intranet auf unterschiedliche Art und 
20 Weise, z.B. zum gelegentlichen Surfen, zur Ubertragung von 
Datenraten (in unterschiedlicher Grofte) , zum Spielen, etc. 
Gezielte Marketingaktionen fur die unterschiedlichen Nut- 
zungskreise seitens des Internet Service Provider, Erkennen 
_ von Markttrends oder auch das Bestimmen von Kosteneinspa- 
^^^^ rungspotentialen einer Firma (z.B. bei Corporate Networks) 
^^^^ sind bisher nur recht schwer moglich, da eine genaue Zuord- 
nung eines Internet/Intranet-Nutzers zu diversen Verhaltens- 
kategorien technisch nur unzureichend unterstutzt wird. 

30 Es gibt derzeit diverse Tools zur Erkennung von Betrugsf alien 
in der Telekommunikation . Solche Tools basieren auf verschie- 
denen Techniken, wie den regelbasierten Ansatz oder neuronale 
Netze etc. Ausgewertet werden mit diesen Techniken CDR (Call 
Detail Records) oder Signalisierungsdaten des Zeichengabesy- 

35 stems CCS7, 
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Es ist ein Werkzeug unter der Bezeichnung "HP OpenView Smart 
Internet Suite; Smart Internet Usage" angekundigt worden, da 
nutzungs-spezif ische Internet-Daten sammelt, korrelliert und 
verdichtet sowie auf diese Daten eine Retrieval-Funktion (da 
ta mining) anbietet. Die technische Realisderung und der ge- 
naue Umfang der Retrieval-Funktion sind im Detail nicht be- 
kannt geworden . 

Dem Anmeldungsgegenstand liegt das Problem zugrunde, ein Ver 
fahren anzugeben, das gegentiber herkommlichen Verfahren eine 
Erhohung der Signifikanz der Aussage mit verringerter Fehler 
quote aufweist . 

Das Problem wird durch ein Verfahren mit den Merkmalen des 
Anspruchs 1 gelost. 

Durch dieses^Werkze^ug- k5nnen sowohl; friihzeitdg^ Verdachtsmo- 
mente auf .nieht^^^spezif i^eh^^^utzojj^ ' { z^.B > niTcht vertragsge- 
maiJe NutzAon^des^^Cnte^rnfet / Int^^net K^^ges^^mm^lfe^werd 
(Stichwort :^et^g) r-r als- auGh^ Ergebnisse erz^eit^ werden, die 
ftir MarketLn'gzwecke, fur^ eine Markttrenderkennung, fur 
schnelle.^E.eaktionen hinsichtlich eines notwendigen Netzaus- 
baus des Internet / Intranet oder auch zur Einsparung von Ko- 
sten bei der Nutzung des Internet / Intranet genutzt werden 
konnen. 

Durch die Erfindung erhalten Internet Service Provider und 
Firmen extrem gute Aussagen zu - Art der Nutzung des Internet 
/ Intranet ( insbesondere auch zu einer nicht vertragsgemaBen 
Nutzung)- Markttrends (insbesondere auch zu abrupten Verhal- 
tensanderungen hinsichtlich der Nutzung von Internet / Intra- 
net)- Marketing- zu einem notwendigen Netzausbau 
etc. Insbesondere, werden^du diese Erfindung die Nachteile 
der auf dem Markt befindlichen Data Mining Tools beseitigt. 
GemaJi einer besonderen Ausgestaltung des Anmeldungsgegenstan- 
des werden die Ergebnisse der einzelnen Methoden zu einer si- 
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gnifikanten Aussage mit auJJerst geringer Fehlerquote verdich- 
tet (kombiniert , verkniipft) . 

Vorteilhafte Weiterbildungen des Anmeldungsgegenstandes sind 
5 in den Unteranspruchen angegeben. 



Der Anmeldungsgegenstand wird im folgenden als Ausfiihrungs- 
beispiel in einem zum Verstandnis erf orderlichen Uitifang an- 
hand von Figuren naher erlautert. Dabei zeigen: 
10 Fig 1 eine bekannt gewordene Ablauffolge, 

Fig 2 eine prinzipielle Blockdarstellung von Elementen und 

deren Zusaminenwirken beim Anmeldungsgegenstand und 
Fig 3 ein Anwendungsbeispiel fiir die Modellierung einer Ver- 
haltenskategorie im kausalen Netz. 
15 

In den Figuren bezeichnen gleiche Bezeichnungen gleiche Ele- 
mente. 

Das bekannt gewordene Werkzeug arbeitet - soweit erkennbar - 
20 wie in Fig 1 dargestellt f olgendermaiien : In einem 1. Schritt 
werden die Internet-Daten Idat in einer Vorverarbeitung PP 
(fur: preprocessing) nach festen Regeln zu Internet Data Re- 
cords (IDR) korreliert und verdichtet; in einem 2. Schritt 
sind die Internet Data Records mit vom Operator eingegebenen 
^f^^^k Regeln (z. B. in Form von Select Statements) in einem Bewer- 
^^^V tungsvorgang RETR (fur: retrieval. Data mining) als Ergebnis 
OUT ausgebbar. Dabei macht es sich nachteilig bemerkbar, daii 
- Eine Anderung der IDR eine Anderung des Preprocessor be- 
dingt - die Regeln sich nur auf die IDR (insbesondere auch 
30 IDR-Struktur) beziehen durfen.- die IDR statisch sind, wo- 

durch Informationen verlorengehen, - rein regel-basierte Sy- 
steme nicht lernfahig sind, - rein regel-basierte Systeme 
keine "Ausnahmen von der Regel" kennen (damit grolie Anzahl 
von Fehlaussagen) - rein regel-basierte Systeme keine Grenzbe- 
35 reiche kennen. 

Bei dem in Fig 2 dargestellten anmeldungsgemafien Verfahren 
konnen die Internet-Daten Idat einer Regel-basierten Vorver- 
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arbeitung RBPP (fur: Regel-basierter Preprocessor) unterzogen 
werden, wobei die Internet-Daten korreliert und verdichtet 
werden. Die Internet-Daten konnen, gegebenenf alls in vorver- 
arbeiteter Form/ als Zwischenergebnis einer Zwischenspeiche- 
5 rung INTM^ffur: "^Interim' Memory ) -unterzogen -w^^^^^ Die Inter- 

net-Daten -werden, gegebenenf alls in vorverarbeiteter Form und 
gegebenenf alls nach Zwischenspeicherung, einer Einrichtung 
Methodenansatz MA zugefuhrt, die einen regelbasierten Ansatz 
RBA, ein neuronales Netz mit iiberwachtem Training NNUE, eine 

10 dichtebasierte Prof ilmodellierung DBPM und ein kausal neuro- 
nales Netz KNN, im folgenden kausales Netz genannt, aufweist. 
Die Einrichtung Methodenansatz MA arbeitet, wie durch zwei 
doppeltgerichtete Pfeile bezeichnet, mit einer Regelbasis RB, 
in der die Regeln abgespeichert sind, einer Datenbasis MO/TR, 

15 in der die Modellierungs-/Trainingsdaten abgespeichert sind, 
und einei^MDaMs^enfe'asds^"^^ H^^ in-^^der,. dde9teAuswertf^^ des 
aktuelle n^-un & ^o^a^nr^g ang en e r^^ iet>teatot un g s'z e i ^^wne^- ^gespei- 
chert sinndr-^^saonmen Die von^Mei# Einri^chtiangNMethodenansat z 
MA a u s g e g^b^e^e n^^ib^ w . 1 vi^de at i^ba si Hi; S ^ ge sp e i ch e r t e n 

20 Zwischergfebnl^S'S^ konnen in^ei?ner^ Einrichlimig ©@MB (fiir: Com- 
bination) einer'^B'ewertung unterzogen-* werden und werden als 
Ergebnis OUT ausgegeben . 

Das anmeldungsgemaJie Verfahren umfaBt eine Kombination von 
25 vier unterschiedlichen Methodenansatzen, den regel-basierten 
Ansatz und drei Methodenansatze der Neuroinf ormatik (neurona 
les Netz mit Iiberwachtem Training, dichte-basierte Modellie- 
rung und kausales Netz) . Die Regelf ormulierung bzw. die Mo- 
dellierung mit den Methoden der Neuroinf ormatik werden auf 
30 der Basis von Daten durchgefuhrt, die der Internet Service 
Provider oder eine Firma speichert: RADIUS Accounting Daten 
(werden in der Regel gespeichert) , TCP Dump Protokoll Daten 
(Speicherung bei Bedarf, Umfang variabel) , SNMP (Simple Net- 
work Management Protocol ) -Daten (Speicherung bei Bedarf) etc. 
35 Das entstehende Modell stellt ein Controlling- und Marketing- 
werkzeug dar. 
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Das anmeldungsgemaJie Verfahren ist vorgesehen zur Anwendung 
auf Internet / Intranet-Daten, die der Internet Service Pro- 
vider Oder eine Firma speichert. Solche Daten sind u.a. die 
RADIUS Accounting Daten, die TCP Dump Daten und die SNMP Da- 
ten. Das Verfahren kann beliebige weitere Internet / Intra- 
net-Daten bearbeiten. 

Die RADIUS Accounting Daten sind durch Daten gegeben, wie sie 
in der IETF Spezif ikat ion RFC 2139 beschrieben sind. Eine 
reale Implement ierung ist z.B. in Livingston Enterprises 
inc., Radius dictionary, VI. 6, 1997 beschrieben. 

Die TCP D\amp Daten sind durch Daten gegeben, wie sie 
in UNIX man-pages ^tcpdump - dump traffic on a network' be- 
schrieben sind. 

Die SNMP Daten sind durch Daten gegeben, wie sie in den ver- 
schiedenen RFCs der IETF beschrieben sind. Eine tatsachliche 
Implement ierung ist z.B. in Livingston Enterprises Inc., Con- 
figuring SNMP, Manual Portmaster 3 beschrieben. 

Urn die Verarbeitung der Daten zu beschleunigen, kann optional 
ein regel-basierter Preprocessor eingesetzt werden. Der Pre- 
processor hat die Aufgabe, die Internet / Intranet-Daten so 
zu korrelieren und zu verdichten, daJi als Ergebnis Datensatze 
mit den im eigentlichen Verfahren benOtigten Attributwerten 
geliefert werden. 

Grundsatzlich kann ein Preprocessor verwendet werden, wie er 
bei dem bekannt gewordenen Ldsungsvorschlag vorgesehen ist. 
Dies setzt aber voraus, daB die IDR eine Obermenge der vom 
Verfahren benStigten Attributwerte beinhalten. 

In einer bevorzugten Ausfuhrungsform des Anmeldungsgegnstan- 
des wird ein regel-basierter Preprocessor verwendet. Die Re- 
geln steuern dabei die Korrelation und die Verdichtung der 
Internet / Intranet-Daten. 
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Wird im eigentlichen Verfahren ein neues charakteristisches 
Attribut hinzugefUgt oder fallt ein charakteristisches Attri 
but weg, dann kdnnen die'^ Auswahlregeln des Preprocessor ein- 
fach (autematisch) angepaJit werden. Eine automatische Anpas- 
sung der Auswahlregeln kann dabei, wie in der Fig 2 mit ADAP 
(fiir: Adaption) bezeichnet, uber Notifications ( f reilauf ende 
Meldungen) an den Preprocessor gesteuert werden. 

Das nachfolgend beschriebene Verfahren kann damit 

- direkt auf den Internet / Intranet-Daten aufsetzen, 

- auf Ergebnisse eines beliebigen Preprocessors (wie z.B. 
HP (Hewlett Packard) IPR) aufsetzen 

- auf Ergebnisse (in Fig 2 mit INTM bezeichnet) eines spezi- 
fischen regel-basierten Preprocessor auf setzen . 

Das eigentlich^^ Verfahren teilt.-sich in vier Verfahren . Jede 
Verfahren 'verwendet dabei einen anderen Methodenansatz . Die 
vier unters^hiedlich^^Methadenansatze sind: 

- das regel-basierte Verfahren, 

- das neuronals Netz - uberwachtes Lernen 

- die dichte^basierte Prof ilmodellierung 

- das kausale Netz. 

Beim regelbasierten Verfahren lassen sich typische benutzer- 
spezifische Verhaltenskategorien mit Hilfe von Regeln model- 
lieren. Durch eine Verhaltenskategorie wird das Verhalten 
klassif iziert, z.B. konnen die Verhaltenskategorieen "Privat- 
nutzung Student", "Privatnutzung Angestellter" , "Privatnut- 
zung Freiberuf ler", "Nutzung kleiner Geschaf tsbetrieb" , "Nut- 
zung grofier Geschaf tsbetrieb" , "Spieler", "Internet / Intra- 
net-Suchtiger", "Nutzer mit hohem Mailvolumen" etc. durch ih- 
re charakteristischen Eigenschaf ten in Form von Regeln ausge- 
druckt werden. Die Regeln werden auf alle Internet / Intra- 
net-Daten Oder einen Teil dieser Daten (z.B. das Ergebnis ei- 
nes Preprocessing) angewendet. Das Ergebnis des Verfahrens 
ist, dafi jeder Nutzer nach einem Beobachtungs-zeitraum t kei- 
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ner, einer Oder mehrerer Verhaltenskategorien zugeordnet war- 
den kann. Der Beobachtungszeitrauiti kann dabei abhangig von 
der Verhaltenskategorie und dem gewunschten Zweck der Beob- 
achtung variieren. So wird er zur Betrugsentdeckung (als Teil 
des Controlling) sehr klein gewahlt warden (z.B. t= 1 Tag), 
dagegen zur Erzielung von Marketingaussagen einen Zeitraum 
von mehreren Wochen xomfassen (z.B. t=4 Wochen) . Speichert man 
die Ergebnisse eines jeden Beobabachtungszeitraums t(i) nut- 
zer-spezifisch in der Datenbasis HIST, so lassen sich durch 
Vergleich der Einzelergebnisse t(i) recht einfach Anderungen 
im Benutzerverhalten feststellen (z.B. am Anfang entsprach 
die Nutzung eines Nutzers der Verhaltenskategorie "Privatnut- 
zung Student", nunmehr ist sie eher der Verhaltenskategorie 
"Nutzung kleiner Geschaf tsbetrieb" zuzuordnen) . 

Das Ziel ist es, Regeln fur jede Verhaltenskategorie zu for- 
mulieren. Die Regeln werden mit Hilfe von logischen Ausdruk- 
ken beschrieben, in denen als Variablen die Felder (Attribu- 
te) der verschiedenen Datensatze verwendet werden, z.B. 
Nutzung "Privatvertrag Anges tellter " ::= fur alle Datensatze 
des Beobachtungszeitraums gilt: Nutzungszeit Montag bis Frei- 
tag zwischen 17 Uhr und 2 4 Uhr und Nutzungszeit an Wochenen- 
den von 0 Uhr bis 24 Uhr und Datenubertragungsrate < 2 Mega- 
byte pro Nutzung und max. Nutzungszeit = 2 Stunden) 
Nutzung "Privatvertrag Freiberuf ler" ::= es gibt einen Daten- 
satz des Beobachtungszeitraums, fur den gilt: Nicht Nutzung 
"Privatvertrag Angestellter" und ftir alle Datensatze des Be- 
obachtungszeitraums gilt: Datenubertragungsrate < 10 Megabyte 
pro Tag und max. Nutzungszeit = 8 Stunden 

Grundsatzlich konnen sich die Regeln auf einen oder mehrere 
Datensatze (auch verschiedener Dateien) beziehen. 

In der Anwendungsphase des regelbasierten Verfahrens werden 
fur die angegebenen Daten zum Zeitpunkt t alle ausgewahlten 
Regeln uberpruft. Die Ergebnisse werden zunachst benutzer- 
spezifisch in der Datenbasis HIST protokolliert . 
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Starke des regelbasierten Verfahrens: 

- Klassifizierung des Benutzerverhaltens in Form von Verhal- 
tenskategorien 

- Hieraus lassen sich einfach Trends, Marketingaussagen, Ver- 
tragsverletzungen etc. ableiten 

Beim iiberwachten Ansatz wird ein Neuronales Netz mit einem 
Satz von Beispielen trainiert. Die Vorausset zung filr das 
Training ist, dafi zu jedem Beispiel der zugehorige Zielwert 
gegeben ist, d.h. es muB zum Zeitpunkt des Trainings bekannt 
sein, ob z.B. fur das betrachtete Beispiel eine festgelegte 
Nut zung vorlag oder nicht (festgelegte Nutzungen konnen z.B 
sein "Vertragsverletzung Privatvertrag Angestellter" , 
"Schwerpunktnutzung Surf en", "Schwerpunktnutzung Spieler" 
etc.). Dabei mUssen die zu untersuchenden Zielwerte und die 
ftir das Bed:^spiel Gharakfeeristis©hen Attribute ^orgegeben wer- 
den. Die cJiarsckteristischen Attribute^e^stvi^ das Verhalten 
eines Nut^zters^as Verhal^ten wiederum ist^rabfeangig von be- 
stimmten "Attritoufewerten ^^^fden ©a^en^ed^ . 
CharakteEfefeLs^e Attribute- konnen z.B.4*sein: 

- mittleref^^Nutzungszeit^^es^-Nutzers an einem Tag uber einen 
Beobachtungszeitraum ( z.B. vier Wochen) 

- Streuung der Nutzungszeit des Nutzers 

- maximale Nutzungszeit 

- minimale Nutzungszeit 

- mittlere Ubertragungsrate des Nutzers an einem Tag uber ei- 
nen Beobachtungszeitraum (z.B. vier Wochen) 

- Streuung der Ubertragungsrate des Nutzers 

- maximale Rate 

- minimale Rate 

- mittlere- Nutzungsdauer des Nutzers von speziellen Inter- 
net/Intranet Services uber einen Beobachtungszeitraum (z.B 
vier Wochen) 

- Streuung der Nutzungdauer des Nutzers 

- maximale Nutzungdauer 

- minimale Nutzungdauer 
etc. 
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In der Trainingsphase (Vorabschritte) des Neuronalen Netzes 
ist es Ziel, ein Modell zu erstellen, das fur einen Nutzer 
anhand des gegebenen Beispiels entscheidet, ob eine Nutzung 
des Internet/Intranetzugangs hinsichtlich eines oder mehrerer 
definierter Zielwerte stattfindet oder nicht. Die Modeller- 
stellung erfolgt durch das Uberwachte Training, dessen Grund- 
lagen in Rijmelhart, D.E., Hinton, G.E. und Williams, R.J. Le- 
arning internal representation by error backpropagation. In 
Parallel Distributed Processing, S. 318-362, Cambridge, MA, 
MIT Press, 1986) im einzelnen beschrieben sind. 

In der Trainingsphase werden folgende Schritte durchgef iihrt : 
Jedem Nutzer wird ein Verhaltensmuster in Form von Attributen 
zugeordet, das ein gewisses Profil uber einen langeren Zeit- 
raum beschreibt. Die Attribute charakterisieren dabei die 
Nutzung hinsichtlich eines definierten Zielwertes. Der dem 
Verhaltensmuster zugrundeiiegende Zeitraum sollte nicht kur- 
zer als vier Wochen sein und vor dem Zeitpunkt liegen, in dem 
die Methode fur o.g. Zweck angewendet wird. 

Das neuronale Netz wird anhand von Trainingsdaten auf die 
Nutzung hinsichtlich der definierten Zielwerte trainiert. Bei 
den Trainingsdaten ist bekannt, ob die Nutzung einem bestimm- 
ten Zielwert zugeordnet werden kann oder nicht. 

In der Anwendungsphase des neuronalen Netzes, die nach Ab- 
schluJi der Trainingsphase beginnt, werden kontinuierlich fol- 
gende Schritte durchgef uhrt : 

Das Neuronale Netz entscheidet auf Basis der Beispiele, ob 
die Nutzung einem bestimmten Zielwert zugeordnet werden kann 
Oder nicht. Diese Entscheidung wird nutzer-spezif isch als Er- 
gebnis des Beobachtungszeitraumes in der Datenbasis HIST pro- 
tokolliert . 
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Das neuronale Netz kann bei Bedarf mit neuen Zielwerten hin- 
sichtlich seiner Nutzung (z.B. bis dato noch nicht bekannten 
Fallen von Vertragsverletzungen) trainiert warden, 

5 Diese Methode anwendbar, wenn der Nutzer Bestandteil der Da- 
ten ist. 

Starke dieser Methode: 

- Einfache Zuordnung von Ausnahmen 

10 - Beriicksichtigung von Ausnahmen im Ergebnis 

- Lernf ahigkeit 

Bei der dichte- basierten Prof ilmodellierung handelt es sich 
um eine probabilistische Modellierung des Verhaltens zu jedem 

15 Nutzer (probabilistische Prof ilmodellierung) , d.h. es wird 

fiir jeden^^fTuls^er^ ein Modell-^^anhand^ -zu diesem Nutzer zuge- 
horigen Beispdeien ers^tellt Die^se: <Beispiele bestehen aus 
charakterlsfcis-Ghen Attribu^en und aus nbe stroma ten- Attributwer- 
ten, die dier^Nutzung^^des 'Int:erfi'et/^^ hinsichtlich eines 

20 Oder mehrerer Zieiwer^te besehreibBn't^ei^pie^e^ 

stische Attribute sind im vorhergehenderf'NAbschnitt beschrie- 
ben» 

In der Trainingsphase der dichte-basierten Prof ilmodellierung 
werden folgende Schritte durchgefuhrt : Jedem Nutzer wird ein 

25 Satz von Beispielen zugeordet, der die Verhaltensweise des 

Nutzers tiber einen langeren Zeitraum beschreibt. Der dem Ver- 
haltensmuster zugrundeliegende Zeitraum sollte nicht kurzer 
als vier Wochen sein und vor dem Zeitpunkt liegen, in dem die 
Methode fiir Kontroll- und Marketingzwecke angewendet wird, 

30 Fiir jeden Nutzer wird ein probabilistisches Profil erstellt, 
Diese Erstellung erfolgt durch die Dichteschatzung mit dem 
EM-Algorithmus . Die genaue Beschreibung ist in Chris Bishop, 
Neural Networks in Pattern Recognition, Oxford Press, 1996 
enthalten.Nach AbschluB der Trainingsphase, beginnt die An- 

35 wendungsphase der dichte-basierten Prof ilmodellierung, in der 
kontinuierlich folgende Schritte durchgefuhrt werden: Die Da- 
ten beispielsweise eines Tages werden hinsichtlich der fur 
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die probabilistische Prof ilmodellierung bestimmten Datenin- 
halte analysiert (ein neues Beispiel wird erzeugt) .Das dich- 
te-basierte Prof ilmodell gibt einen Wert aus, der eine Wahr- 
scheinlichkeit fur die Nutzung des Internet/Intranet der be- 
trachteten Entitat hinsichtlich der definieren Zielwerte dar- 
stellt. Dieser Wert wird protokolliert . Weicht dieser Wert 
gegenuber den vorangegangenen Werten uber einen vorgegebenen 
Schwellwert hinaus ab, dann erfolgt ein Hinweis, dafl das Er- 
gebnis in jedem Fall angezeigt werden soil. Mit dieser Methode 
kann sehr einfach festgestellt werden, wenn sich die Nutzung 
des Internet/Intranet plotzlich andert.Mit dem aktuellen Bei- 
spiel wird das Prof ilmodell nachadaptiert . Diese Methode ist 
anwendbar, wenn der Nutzer Bestandteil der Daten ist. Starke 
dieser Methode:- Erkennung einer abrupten Anderung des Benut- 
zerverhaltens - Lernf ahigkeit 

Basis fur die Methode des kausalen Netz' ist die Modellierung 
typischer Verhaltensszenarien in Form von kausalen Abhangig- 
keiten und Wahrscheinlichkeiten bestimmter Dateninhalte wie 
es in dem Beispiel "Privatnutzung Angestellter" in Fig 3 dar- 
gestellt ist. Einer Privatnutzung Angestellter PA sind eine 
bestimmte Nutzungszeit UC (ftir: UseClock) , eine bestimmte 
Nutzungsdauer UT (fur: UseTime) und eine bestimmte Ubertra- 
gungsrate RATE zugeordnet. Die Wochentage haben, je nachdem 
ob es sich um einen Werktag WD (fur: working day) Oder urn ein 
Wochenende WE (fur: week end) handelt, Einflufl auf die Hohe 
der Nutzungszeit, die Nutzungsdauer und die Obertragungsrate . 
Die kausalen Abhangigkeiten basieren auf der Auswertung be- 
kannter Falle. Sie mussen nicht spezifischen Nutzern zugeord- 
net sein.In der Phase der Modellierung des kausalen Netzes 
werden folgende Schritte durchgef uhrt : Fur alle Daten werden 
die kausalen Abhangigkeiten hinsichtlich der Daten-Inhalte 
formuliert .An den Stellen, wo die kausalen Abhangigkeiten 
existieren, werden entsprechende Wahrscheinlichkeiten zuge- 
ordnet. In der Modellierungsphase ist das Domanewissen des 
Fachexperten notwendig. Die Grundlage uber das kausale Netz 
ist in Finn V. Jensen, An Introduction to Bayesian Networks, 
UCL Press 1996 beschrieben . In der Anwendungsphase des kausa- 
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len Netzes warden kontinuierlich folgende Schritte durchge- 
fllhrtrDie Datensatze der zu untersuchenden Daten werden kon- 
tinuierlich auf die f orraulierten kausalen Abhangigkeiten hin 
untersucht. Fur jeden Nutzer bzw. jedes Ereignis wird ent- 
5 schieden, itiit welcher Wahrscheinlichlichkeit eine spezif ische 
Nutzung hinsichtlich des definierten Szenarios vorliegt. Die- 
se Entscheidung wird als Ergebnis des Beobachtungszeitraumes 
in der Datenbasis HIST protokolliert . 1st der Nutzer Bestand- 
teil der Daten, dann werden die Ergebnisse nutzer-spezif isch 

10 protokolliert. Die Wahrscheinlichkeiten hinter den kausalen 
Abhangigkeiten konnen nachadaptiert werden. Die kausalen Ab- 
hangigkeiten von neuen, bis dato noch nicht bekannten Katego- 
rieen werden bei Bedarf den existierenden kausalen Abhangig- 
keiten hinzugefugt. Diese Methode lafit sich auch dann anwen- 

15 den, wenn der Nutzer nicht Bestandteil des Datensatzes ist. 
In diesem Fall kann aber eine Kategorie keinem spezif ischen 
Nutzer zugeordnet werden . Starke der Methode des kausalen Net- 
zes:- Zuordnung von Grenzbereichen in Verhaltenskategorien- 
Erkennen von Grenzbereichen in Verhaltenskat.egorien- Lernfa- 

20 higkeitGrundsatzlich ist es moglich, die Einzelergebnisse der 
einzelnen Verfahren auszugeben. In weiterer Ausgestaltung des 
Anmeldungsgegenstandes werden die Einzelergebnisse der ein- 
zelnen Verfahren zu einem Gesamtergebnis verdichtet. Diese 
Verdichtung bezieht die Einzelergebnisse der verschiedenen 

25 Verfahren ein. Die Einzelergebnisse konnen sowohl aus dem 
aktuellen als auch aus vergangenen Beoabachtungszeitraumen 
stammen. Jedes der beschriebenen Verfahren hat spezif ische 
Starken. Dies kann bei einer Verdichtung ausgenutzt werden, 
wie im folgenden Beispiel beschrieben: Ein Nutzer x wird z.B. 

30 durch das regel-basierte Verfahren eindeutig der Verhaltens- 
kategorie "Privatnutzung Freiberuf ler " zugeordnet, wenn er an 
einem Tag das Internet mehr als 2 Stunden genutzt hat (bezo- 
gen auf die oben dargestellte Beispielregel) . Das kausale 
Netz sieht diesen Nutzer x aber vielmehr im Verhaltensszena- 

35 rio "Privatnutzung Angestellter" , da er z.B. in mehr als 90% 
der Datensatze die Nutzungszeit von weniger als 2 Stunden 
eingehalten hat. Diese Erkenntnisse konnten dann im Gesamter- 
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gebnis dergestalt angezeigt werden, dafi es sich bei der Nut- 
zung des Internet / Intranet durch den Nutzer x mit einigen 
geringfiigigen Ausnahmen urn eine "Privatnutzung Angestellter" 
handelt. Ein weiteres Beispiel ftlr eine Verdi chtung ist die 
Trenderkennung durch Auswertung von Ergebnissen verschiedener 
Beobachtungszeitraume . 
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Patentanspriiche 

1. Verfahren zur Erfassung des Nutzungsverhaltens eines Teil 
nehmers ±m Internet/ Intranet, dem-zufolge 

5 - die Teil»nehmerdaten uber einen festgelegten Zeitraum proto- 
kolliert ■ werden 
- die protokollierten Teilnehmerdaten nach mindestens einem 
der folgenden Verfahren ausgewertet werden: 

• Regel-basierter Ansatz, 

10 • neuronales Netz, uberwacht trainiert, 

• dichte basierte Prof ilmodellierung, 

• kausales Netz 

derart, dafi eine Zuordnung eines Teilnehmers nach Mafigabe 
seines Teilnehmer-Verhaltens zu einer Kategorie von Nut- 
15 zungsverhalten^- gegeben ist. 

2. Verf ahsrerP^ttfiach^A^^ 1, 

d a d u r c h t . g ie k e n n z e i g h n^ e t , 

dali die Tei^Kifieto folgenden 
2 0 Kategorien?fr^(Dn Da^-eru^e^gfeben^ >sind ft^^PLAJDfJOUS^^ 
TCP-Diiinp-^Pro4sokoll-€)aten . 

3. Verfahren nach einem der vorstehenden Anspriiche, 
dadurch gekennzeichnet, 

25 dafi die Teilnehmerdaten vor der Auswertung einer Regel- 
basierten Vorbehandlung unterzogen werden. 

4. Verfahren nach Anspruch 3, 
dadurch gekennzeichnet, 

30 dafi die einer Vorbehandlung unterzogenen Teilnehmerdaten vor 
der Auswertung zwischengespeichert werden. 

5. Verfahren nach einem der Ansprtiche 3 oder 4, 
dadurch gekennzeichnet, 

35 dafi nach Mafigabe des Auswerteergebnisses mindestens eines der 
Verfahren eine automatische Anpassung der Auswahlregeln fur 
die Vorbehandlung der Teilnehmerdaten erfolgt. 
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6. Verfahren nach einem der vorstehenden Anspruche, 
dadurch gekennzeichnet, 

da5 die Ergebnisse, insbesondere die aktuellen Ergebnisse, 
der Auswertungen der einzelnen Verfahren zu einem Endergebnis 
verknupft werden. 

7. Verfahren nach einem der vorstehenden Anspruche, 
dadurch gekennzeichnet, 

dal3 die Ergebnisse der Auswertungen der einzelnen Verfahren 
eines aktuellen Beobachtungszeitraumes und eines vergangenen 
Beoabachtungszeitraumes zu einem Endergebnis verknupft wer- 
den. 
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Zusammen fas sung 

Controlling- und Marketingverf ahren fiir die Nutzung des In- 
ternet/Intranet 

5 

Auf die Daten eines Teilnehmers im Internet/ Intranet werden 
verschiedene Methoden wie der regelbasierte Ansatz, ein neu- 
ronales Netz mit iiberwachtem Training, eine dichtebasierte 
Prof ilmodellierung und ein kausales Netz angewendet und die 

10 Ergebnisse daraus gegebenenf alls kombiniert, um fiir das Nut- 
zungsverhalten eine Erhohung der Signifikanz der Aussage mit 
verringerter Fehlerquote zu erzielen, wodurch eine friihzeiti- 
ge Erkennung von Unregelmaliigkeiten im Nutzungsverhalten, 
Aussagen uber die Notwendigkeit eines Netzausbaus sowie si- 

15 gnifikante Aussagen fur Marketingzwecke und liber Kosten gege- 
ben sind. 
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